맨위로가기

베이즈 정리

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

베이즈 정리는 확률론에서 사건 A와 B의 조건부 확률 사이의 관계를 나타내는 정리이다. 이는 사건 B가 발생했을 때 사건 A가 발생할 확률인 사후 확률을, 사건 A가 발생했을 때 사건 B가 발생할 확률인 조건부 확률, 사건 A와 B의 사전 확률을 사용하여 계산하는 방법을 제공한다. 베이즈 정리는 다음과 같은 식으로 표현된다: P(A|B) = P(B|A)P(A) / P(B). 여기서 P(A)는 A의 사전 확률, P(A|B)는 B가 주어졌을 때 A의 사후 확률, P(B|A)는 A가 주어졌을 때 B의 조건부 확률, P(B)는 B의 사전 확률을 나타낸다. 베이즈 정리는 약물 검사 결과 해석, 유전 질환 위험도 계산, 스팸 메일 필터링 등 다양한 분야에 응용되며, 베이즈 추론의 핵심 원리이다.

더 읽어볼만한 페이지

  • 통계학 정리 - 중심 극한 정리
    중심 극한 정리는 독립적인 확률 변수들의 합이 특정 조건에서 정규 분포에 가까워지는 현상을 설명하는 확률론 및 통계학의 중요 정리로, 통계적 추론, 가설 검정 등 다양한 분야에 활용되며 여러 변형이 존재한다.
  • 통계학 정리 - 가우스-마르코프 정리
    가우스-마르코프 정리는 선형 회귀 모형에서 오차항이 특정 조건을 만족할 경우 최소제곱 추정량이 최량 선형 불편 추정량임을 나타낸다.
  • 확률론 정리 - 중심 극한 정리
    중심 극한 정리는 독립적인 확률 변수들의 합이 특정 조건에서 정규 분포에 가까워지는 현상을 설명하는 확률론 및 통계학의 중요 정리로, 통계적 추론, 가설 검정 등 다양한 분야에 활용되며 여러 변형이 존재한다.
  • 확률론 정리 - 전체 확률의 법칙
    전체 확률의 법칙은 사건 A의 확률을 계산하기 위해 사용되는 정리로, 상호 배타적이고 전체를 포괄하는 사건들의 집합 B에 대해, A의 확률은 각 B의 조건부 A의 확률과 B의 확률의 곱의 합과 같으며, 가중 평균으로 해석되기도 한다.
  • 수학 정리 - 마스터 정리
    마스터 정리는 분할 정복 알고리즘의 시간 복잡도 분석 도구로서, 점화식을 세 가지 경우로 나누어 재귀 알고리즘의 효율성을 파악하고, 다양한 정렬 및 일반 알고리즘 분석에 활용되지만, 특정 조건에서는 적용이 제한될 수 있습니다.
  • 수학 정리 - 중심 극한 정리
    중심 극한 정리는 독립적인 확률 변수들의 합이 특정 조건에서 정규 분포에 가까워지는 현상을 설명하는 확률론 및 통계학의 중요 정리로, 통계적 추론, 가설 검정 등 다양한 분야에 활용되며 여러 변형이 존재한다.
베이즈 정리
베이즈 정리
개요
유형정리
분야확률론, 통계학, 과학
명명 유래토머스 베이즈
공식
수식$P(A|B) = rac{P(B|A)P(A)}{P(B)}$
변수 설명P(A|B): 사건 B가 일어났을 때 사건 A가 일어날 조건부 확률 (사후 확률)
P(A): 사건 A가 일어날 확률 (사전 확률)
P(B|A): 사건 A가 일어났을 때 사건 B가 일어날 조건부 확률 (우도)
P(B): 사건 B가 일어날 확률 (주변 확률)
관련 개념
관련 항목확률론
통계학
베이즈 추론
사전 확률
사후 확률
조건부 확률
확률 밀도 함수
믿음 전파
네이브 베이즈 분류기

2. 정의

확률공간 (P,\Pr)에서 A,B\subset P가 가측 집합이고, \Pr(B)>0일 때, 베이즈 정리는 다음과 같이 표현된다.[15]

:\Pr(A|B)=\frac{\Pr(B|A)\Pr(A)}{\Pr(B)}\propto\mathcal L(A|B)\Pr(A)

각 항의 의미는 다음과 같다.


  • \Pr(A)는 ''A''의 사전 확률로, 아직 사건 ''B''에 관한 어떠한 정보도 알지 못하는 것을 의미한다.
  • \Pr(A|B)는 ''B''의 값이 주어진 경우에 대한 ''A''의 사후 확률이다.
  • \Pr(B|A)는 ''A''가 주어졌을 때 ''B''의 조건부 확률이다.
  • \mathcal L(A|B) = \Pr(B|A)B가 주어졌을 때 A가능도이다.
  • \Pr(B)는 ''B''의 사전 확률이며, 정규화 상수의 역할을 한다. 이 값은 \Pr(B) = \int_A\Pr(B|A)를 이용하여 구할 수 있다.


A는 불확실성을 계산해야 하는 대상이며, B는 관측하여 값을 알아낼 수 있는 대상으로 생각한다면, A의 확률은 B가 관측된 후 P(A)에서 P(A|B)로 변화하며, 베이즈 정리는 이때의 변화를 계산하는 방법을 제공한다.

베이즈 정리는 다음과 같은 식으로 표현된다.[32]

:P(A \mid B) = \frac{P(B \mid A) \, P(A)}{P(B)}

여기서 AB사건이며, P(B) \neq 0이다.

  • P(A\vert B)조건부 확률로, B가 참일 때 사건 A가 발생할 확률이다. 이는 B가 주어졌을 때 A사후 확률이라고도 한다.
  • P(B\vert A) 역시 조건부 확률로, A가 참일 때 사건 B가 발생할 확률이다. P(B\vert A)=L(A\vert B)이므로, 고정된 B에 대한 A의 가능도로 해석할 수도 있다.
  • P(A)P(B)는 각각 어떠한 조건 없이 AB를 관찰할 확률이며, 각각 사전 확률과 주변 확률이라고 한다.


사건 ''A''와 ''B''에 대해, ''P''(''B'') ≠ 0 이라는 조건 하에,

:P(A| B) = \frac{P(B | A) P(A)}{P(B)} .

베이즈 추론에서, 사건 ''B''는 고정되어 있으며, ''B''가 다양한 사건 ''A''에 대한 믿음에 미치는 영향을 고려할 때, 베이즈 정리의 사후 확률은 분자에 비례한다.

:P(A| B) \propto P(A) \cdot P(B| A) .

즉, 사후 확률은 사전 확률과 가능도의 곱에 비례한다.[20]

사건 ''A''1, ''A''2, ..., 가 상호 배타적이고 포괄적이라면, 확률의 합이 1이 되어야 한다는 사실을 사용하여 비례 상수를 결정할 수 있다. 예를 들어, 주어진 사건 ''A''에 대해, 사건 ''A'' 자체와 그 여집합 ¬''A''는 배타적이고 포괄적이다.

두 개의 경쟁적인 명제 또는 가설에 대한 베이즈 정리의 또 다른 형식은 다음과 같다.

:P(A| B) = \frac{P(B| A) P(A)}{ P(B| A) P(A) + P(B| \neg A) P(\neg A)}.

인식론적 해석의 경우:

명제 ''A''와 증거 또는 배경 ''B''에 대해,[21]

  • P(A)사전 확률이며, ''A''에 대한 초기 신뢰도이다.
  • P(\neg A)는 ''not-A'', 즉 ''A''가 거짓이라는 초기 신뢰도로, P(\neg A) =1-P(A) 이다.
  • P(B| A)조건부 확률 또는 가능도로, 명제 ''A''가 참일 때 ''B''에 대한 신뢰도이다.
  • P(B|\neg A)조건부 확률 또는 가능도로, 명제 ''A''가 거짓일 때 ''B''에 대한 신뢰도이다.
  • P(A| B)사후 확률이며, ''B''를 고려한 후의 ''A''의 확률이다.

3. 베이즈 정리 유도

조건부 확률의 정의에 의해, 사건 B가 일어났을 때 사건 A의 조건부 확률은 다음과 같다.

:P(A|B) = \frac{P(A \cap B)}{P(B)} (단, P(B) \neq 0)

확률의 곱셈 정리에 의해,

:P(A \cap B) = P(A|B)P(B) = P(B|A)P(A)

이다.

전체 확률의 법칙에 의해, 표본 공간이 사건 ''A''1, ''A''2, ... 로 분할될 때,

:P(B) = \sum_{j}P(B \cap A_j) = \sum_{j} P(B| A_j) P(A_j)

이다.

위 식들을 결합하면 베이즈 정리가 유도된다.

:P(A_1|B) = \frac{P(B \cap A_1)}{P(B)} = \frac{P(B|A_1)P(A_1)}{\sum_{j} P(B| A_j) P(A_j)}[15]

특히, 사건 A와 그 여사건 ¬A에 대해 베이즈 정리는 다음과 같이 나타낼 수 있다.

:P(A| B) = \frac{P(B| A) P(A)}{ P(B| A) P(A) + P(B| \neg A) P(\neg A)}

4. 역사

토머스 베이즈의 원고는 리처드 프라이스가 베이즈 사후 1763년에 〈확률론의 한 문제에 대한 에세이〉(An Essay towards solving a Problem in the Doctrine of Chances영어)라는 제목으로 출판하면서 최초로 등장하였다.[35] 이후 피에르시몽 라플라스는 1774년에 같은 정리를 재발견하고 1812년에 수식화하였다.[36][37]

베이즈 정리는 통계학자이자 철학자인 토머스 베이즈의 이름을 따서 명명되었다. 베이즈는 조건부 확률을 사용하여 증거를 통해 미지의 매개변수에 대한 한계를 계산하는 알고리즘(그의 명제 9)을 제공했다. 그의 연구는 1763년 ''확률 교리의 문제 해결을 위한 에세이''로 출판되었다. 베이즈는 (현대 용어로) 이항 분포의 확률 매개변수에 대한 분포를 계산하는 방법을 연구했다.

베이즈가 사망한 후, 그의 가족은 그의 논문을 친구이자 목사이자 철학자이며 수학자인 리처드 프라이스에게 넘겼다. 리처드 프라이스는 2년이 넘는 기간 동안 미출판된 원고를 상당 부분 편집한 후, 1763년 12월 23일 왕립 학회에서 소리내어 읽어줄 친구에게 보냈다.[1] 프라이스는 베이즈의 주요 저작인 "확률 교리의 문제 해결을 위한 에세이"(1763)를 편집했으며, 이 저작은 ''철학 회보''에 실렸고,[3] 베이즈 정리를 담고 있다. 프라이스는 이 논문에 베이즈 통계의 철학적 기초의 일부를 제공하는 서문을 썼으며 베이즈가 제시한 두 가지 해결책 중 하나를 선택했다. 1765년, 프라이스는 베이즈의 유산에 대한 그의 공로를 인정받아 왕립 학회의 회원으로 선출되었다.[4][5]

베이즈와는 별도로, 피에르시몽 라플라스는 1774년에, 그리고 나중에는 1812년 그의 ''확률의 분석적 이론''에서 조건부 확률을 사용하여 증거가 주어졌을 때 사전 확률로부터 갱신된 사후 확률의 관계를 공식화했다. 그는 베이즈의 연구를 알지 못한 채 1774년에 베이즈의 결과를 재현하고 확장했다.[7] 확률의 베이즈적 해석은 주로 라플라스에 의해 개발되었다.[8]

약 200년 후, 해럴드 제프리스 경은 베이즈의 알고리즘과 라플라스의 공식을 공리계를 기반으로 하여, 1973년 저서에서 베이즈 정리를 "확률 이론에 대한 피타고라스 정리가 기하학에 대한 것과 같다"고 썼다.[9]

스티븐 스티글러는 베이즈 정리가 베이즈보다 앞서 영국의 시각 장애인 수학자 니콜라스 손더슨에 의해 발견되었다는 베이즈적 주장을 사용했다.[10][11] 그러나 그 해석은 논쟁의 여지가 있다.[12]

마틴 후퍼[13]와 샤론 맥그레인[14]리처드 프라이스의 기여가 상당하다고 주장했다. 현대적 기준에 따르면, 베이즈-프라이스 규칙이라고 불러야 한다는 주장도 있다.[14]

5. 베이즈 추론

베이즈 추론은 베이즈 정리를 사용하여 확률적 추론을 수행하는 방법으로, 피에르시몽 라플라스에 의해 시작되었으며 현재 베이즈 통계학의 시초가 되었다. 사건의 확률이라는 개념을 채택하며, 스팸 메일 필터링과 같은 작업의 자동화에 이용된다.[1]

확률의 베이즈적 해석에 따르면, 베이즈 정리는 증거를 고려하기 전과 후의 명제에 대한 믿음의 정도를 연결한다. 예를 들어, 동전이 앞면이 나올 확률이 뒷면이 나올 확률의 두 배라고 50% 확신하는 경우를 생각해 보자. 동전을 여러 번 던져 결과를 관찰하면, 그 믿음의 정도는 결과에 따라 상승하거나 하락할 수 있다. 명제 ''A''와 증거 ''B''에 대해, 사전 확률 ''P'' (''A'')는 ''A''에 대한 초기 믿음의 정도이고, 사후 확률 ''P'' (''A'' | ''B'')는 ''B''가 참이라는 소식을 반영한 후의 믿음의 정도이다. 분수는 ''B''가 ''A''에 제공하는 지원을 나타낸다.

트리 다이어그램을 사용한 빈도주의적 해석


빈도주의적 해석에서 확률은 "결과의 비율"을 측정한다. 예를 들어, 어떤 실험을 여러 번 수행한다고 가정해보자. ''P''(''A'')는 속성 ''A''를 가진 결과의 비율(사전 확률)이고, ''P''(''B'')는 속성 ''B''를 가진 결과의 비율이다. ''P''(''B'' | ''A'')는 속성 ''A''를 가진 결과 중 속성 ''B''를 가진 결과의 비율이며, ''P''(''A'' | ''B'')는 속성 ''B''를 가진 결과 중 ''A''를 가진 결과의 비율이다(사후 확률). 베이즈 정리의 역할은 트리 다이어그램을 통해 가장 잘 시각화된다. 두 다이어그램은 반대 순서로 ''A''와 ''B''에 의해 동일한 결과를 분할하여 역 확률을 얻는다. 베이즈 정리는 서로 다른 분할을 연결한다.

베이즈 통계학에서는 사건의 확률이라는 개념을 채택하여, 반드시 빈도에 기반하지 않는 확률을 '확률'로 간주한다.[1]

5. 1. 비판

베이즈 통계학은 사건의 확률이라는 개념을 채택하여, 빈도에 기반하지 않는 확률도 '확률'로 간주한다.

또한 베이즈 정리를 사용하여 '''사전 확률''' 및 우도를 가정한 상태에서 '''사후 확률'''을 제시하는 상대적인 메커니즘을 주장한다. 따라서 '''사후 확률''' 계산 결과의 신빙성 및 유용성은 사전 분포와 우도 설정에 달려 있으므로 신중을 기해야 한다. 이는 베이즈 통계학이 불확실성을 포함하는 문제를 사람에 따라 다른 확률을 사용하여 정식화하는 것을 허용하는 주관 확률이라는 입장을 취하고 있기 때문이다. 이러한 입장은 아직 분석 대상이 되지 않은 새로운 문제에 대한 접근을 가능하게 한다는 장점이 있지만, 확률 결정 방식에 객관성이 결여되었다는 객관 확률 측의 비판도 있다.

6. 응용

베이즈 정리는 다양한 분야에서 의사 결정 및 확률 추정에 활용된다.
약물 검사베이즈 정리는 약물 검사 결과를 올바르게 해석하는 데 도움을 준다. 약물 검사의 민감도(실제 약물 사용자를 양성으로 판정하는 비율)와 특이도(실제 약물 비사용자를 음성으로 판정하는 비율)가 아무리 높아도, 약물 사용자 비율(유병률)이 낮으면 위양성(가짜 양성) 비율이 높아질 수 있다.

예를 들어, 민감도 99%, 특이도 99%인 약물 검사가 있고, 전체 인구의 0.5%만 약물을 사용한다고 가정하자. 이때 무작위로 선택된 사람이 양성 반응을 보였을 때, 실제로 약물 사용자일 확률은 약 33.2%에 불과하다. 이는 위양성이 진양성보다 많기 때문이다. 특이도를 높이면 양성 예측도(검사 결과가 양성일 때 실제로 약물 사용자일 확률)를 높일 수 있다.

약물 검사 예시를 나타내는 트리 다이어그램. 기호 U, Ū, +, -는 각각 사용자, 비사용자, 양성, 음성인 사건을 나타낸다.

유전 질환유전학에서 베이즈 정리는 특정 유전 형질을 가질 확률을 추정하는 데 사용된다. 가족력이나 유전자 검사 결과 등을 바탕으로 질병 위험 또는 보인자(특정 질병의 유전자를 가지고 있지만 겉으로 드러나지 않는 사람) 확률을 계산하여 유전 상담 및 생식 계획에 활용한다.[26]

예를 들어, 낭성 섬유증(CF) 가족력이 있는 여성이 CF 검사에서 음성 판정을 받은 경우, 베이즈 정리를 이용하여 자녀가 CF를 가지고 태어날 위험을 계산할 수 있다. 부모의 유전자형 조합에 따른 사전 확률과 검사 결과에 따른 조건부 확률을 이용하여 사후 확률을 계산하는 방식이다.
기타 응용세 죄수 문제, 몬티 홀 문제, 두 아이 문제, 두 봉투 문제와 같은 여러 문제 해결에 조건부 확률 계산과 베이즈 정리가 활용된다.

벌레 예시를 설명하는 트리 다이어그램. ''R, C, P'' 및 \overline{P} 는 희귀종, 일반종, 패턴 및 패턴 없음 이벤트를 나타낸다. 괄호 안의 백분율은 계산된 값이다. 세 개의 독립적인 값이 주어지므로 역 트리도 계산할 수 있다.


예를 들어, 곤충학자가 등 무늬를 보고 희귀 아종의 딱정벌레일 가능성을 추정하는 상황을 생각해 보자. 희귀 아종의 98%가 특정 패턴을 가지고 있고, 일반 아종은 5%만 해당 패턴을 가진다. 희귀 아종은 전체의 0.1%를 차지한다. 이 경우, 패턴을 가진 딱정벌레가 희귀종일 확률은 베이즈 정리를 통해 약 1.9%로 계산된다.

6. 1. 약물 검사

베이즈 정리는 약물 검사 결과를 해석하는 데 중요한 도구로 사용될 수 있다. 약물 검사는 민감도와 특이도라는 두 가지 중요한 지표를 가진다. 민감도는 실제로 약물을 사용한 사람을 양성으로 정확하게 판정하는 비율이고, 특이도는 약물을 사용하지 않은 사람을 음성으로 정확하게 판정하는 비율이다.

하지만, 민감도와 특이도가 아무리 높아도, 실제로 약물을 사용하는 사람의 비율(유병률)이 낮으면 위양성(실제로는 약물을 사용하지 않았는데 양성으로 판정되는 경우) 비율이 높아질 수 있다.
예시:어떤 약물 검사가 민감도 99%, 특이도 99%라고 가정해보자. 그리고 전체 인구의 0.5%만이 실제로 약물을 사용한다고 가정하자.

이 경우, 무작위로 선택된 사람이 검사에서 양성 반응을 보였을 때, 실제로 약물 사용자일 확률은 다음과 같이 계산된다.

:

\begin{align}

P(\text{U} \mid \text{+}) &= \frac{P(\text{+} \mid \text{U}) \, P(\text{U})}{P(+)} \\

&= \frac{P(\text{+} \mid \text{U}) \, P(\text{U})}{P(\text{+} \mid \text{U}) \, P(\text{U}) + P(\text{+} \mid \overline{\text{U}}) \, P(\overline{\text{U}})} \\

&= \frac{0.99 \times 0.005}{0.99 \times 0.005 + 0.01 \times 0.995} \\

&\approx 0.332

\end{align}

즉, 양성 반응을 보인 사람 중 실제로 약물 사용자인 경우는 약 33.2%에 불과하다. 이는 위양성이 진양성보다 많기 때문이다.

이 예시는 특이도가 얼마나 중요한지를 보여준다. 만약 민감도를 100%로 높이고 특이도를 99%로 유지하면 양성 예측도(검사 결과가 양성일 때 실제로 약물 사용자일 확률)는 33.2%에서 33.4%로 거의 증가하지 않는다. 그러나 민감도를 99%로 유지하고 특이도를 99.5%로 높이면 양성 예측도는 49.9%로 크게 증가한다.

6. 2. 유전 질환

유전학에서 베이즈 정리는 개인이 특정 유전형질을 가질 확률을 추정하는 데 사용될 수 있다. 가족력이나 유전자 검사 결과 등을 바탕으로 질병 위험 또는 보인자(특정 질병의 유전자를 가지고 있지만 겉으로 드러나지 않는 사람) 확률을 계산하며, 유전 상담 및 생식 계획에 활용된다.[26]

일례로, 어떤 여성에게 낭성 섬유증(CF) 가족력이 있지만 본인은 CF 검사에서 음성 판정을 받은 경우, 베이즈 정리를 이용하여 이 여성의 자녀가 CF를 가지고 태어날 위험을 계산할 수 있다.

  • 환자에게 증상이 없으므로, 정상 유전자만 가지고 있거나(동형 접합), 정상 유전자와 변이 유전자를 모두 가지고 있을 수 있다(이형 접합). 부모 모두 질병에 걸리지 않았지만 보인자일 수 있다는 정보를 바탕으로, 푸네트 사각형을 사용하여 사전 확률을 구한다.

W
(야생형 대립 유전자에 대한 동형 접합, 비보인자)
M
(이형 접합, CF 보인자)
W
(야생형 대립 유전자에 대한 동형 접합, 비보인자)
WWMW
M
(이형 접합, CF 보인자)
MWMM
(낭성 섬유증 환자)



환자에게 증상이 없으므로 세 가지 가능성(WW, MW, MW)만 남는다. 이 중 환자가 변이 유전자를 가지고 있는 경우는 두 가지(MW, MW)이므로 사전 확률은 2/3 (보인자일 확률) 및 1/3 (보인자가 아닐 확률)이다.


  • 다음으로, 환자가 유전자 검사에서 음성 판정을 받았다는 정보를 고려한다. 이 검사의 정확도가 90%라면, 조건부 확률은 다음과 같이 계산된다.

가설가설 1: 환자는 보인자이다.가설 2: 환자는 보인자가 아니다.
사전 확률2/31/3
음성 검사의 조건부 확률1/101
결합 확률1/151/3
사후 확률1/65/6


  • 마지막으로, 베이즈 정리를 이용하여 사후 확률을 계산하면, 환자가 보인자일 확률은 1/6, 보인자가 아닐 확률은 5/6이 된다.


만약 환자의 남편도 같은 검사를 받고 음성 판정을 받았다면, 동일한 방식으로 베이즈 분석을 수행한다. 자녀가 CF에 걸릴 확률은 부모 각각이 보인자일 확률과 두 보인자에게서 CF 유전자를 가진 자녀가 태어날 확률(1/4)을 곱하여 계산한다.

베이즈 분석은 유전 질환과 관련된 표현형(겉으로 드러나는 특징) 정보를 사용하여 수행할 수도 있다. 예를 들어, 낭성 섬유증은 초음파 검사에서 정상보다 밝게 보이는 '에코성 장'을 통해 태아에게서 발견될 수 있다. 그러나 이 검사는 완벽하지 않으므로, 부모의 유전자 검사 정보와 함께 베이즈 정리를 활용하여 태아가 실제로 질병을 가질 확률을 더 정확하게 추정할 수 있다.[27]

6. 3. 기타 응용

세 죄수 문제, 몬티 홀 문제, 두 아이 문제, 두 봉투 문제와 같은 여러 문제 해결에 조건부 확률 계산과 베이즈 정리가 활용된다.

어떤 곤충학자가 등 무늬를 보고 희귀 아종의 딱정벌레일 수 있다고 생각하는 상황을 가정해 보자. 희귀 아종의 98%가 해당 패턴을 가지고 있어, ''P''(패턴 | 희귀종) = 98%이다. 일반 아종의 경우 5%만이 해당 패턴을 가진다. 희귀 아종은 전체 개체수의 0.1%를 차지한다. 이 경우, 패턴을 가진 딱정벌레가 희귀종일 확률 ''P''(희귀종 | 패턴)은 다음과 같이 베이즈 정리를 통해 계산할 수 있다.

어떤 딱정벌레든 희귀종 또는 일반종이므로, 베이즈 정리의 확장된 형태는 다음과 같다.

:

\begin{align}

P(\text{희귀종} \vert \text{패턴}) &= \frac{P(\text{패턴} \vert \text{희귀종})\,P(\text{희귀종})} {P(\text{패턴})}\\

[8pt] &= \tfrac{P(\text{패턴}\vert \text{희귀종})\,P(\text{희귀종})} {P(\text{패턴} \vert \text{희귀종})\,P(\text{희귀종}) + P(\text{패턴}\vert \text{일반종})\,P(\text{일반종})}\\

[8pt] &= \frac{0.98 \times 0.001} {0.98 \times 0.001 + 0.05 \times 0.999}\\

[8pt] &\approx 1.9\%

\end{align}



즉, 패턴을 가진 딱정벌레가 희귀종일 확률은 약 1.9%이다.

7. 다른 수학적 프레임워크와의 관계

조건부 확률 P(A \vert B)가 정의된 경우, B \to A의 함축을 포착하는 것을 볼 수 있다. 확률적 계산법은 다양한 논리적 추론 규칙을 반영하거나 심지어 일반화한다. 예를 들어, 이진 진리값을 할당하는 것 외에도, 문장에 확률 값을 할당한다. B \to A의 주장은 P(A\vert B) = 1, 즉 조건부 확률이 극단적인 확률 값 1을 갖는다고 주장함으로써 포착된다. 마찬가지로, 함축의 부정을 주장하는 것은 0을 할당함으로써 포착된다.[23]

예를 들어, P(A) = 1이면 (정의된 경우) P(A\vert B) = 1이고, 이는 논리에서 함축 도입 A\to (B \to A)를 수반한다.

마찬가지로, 두 확률의 곱이 1이 되는 것은 두 인수가 모두 1이어야 하므로, 베이즈 정리는

:P(A)\, P(B \vert A) = P(B)\, P(A\vert B)

:\big(A\land(A\to B)\big) \leftrightarrow \big(B\land(B\to A)\big)를 수반하며, 전건 긍정도 포함한다.

양의 값 P(A)에 대해, P(A)P(B)와 같다면, 두 조건부 확률도 같고 그 반대도 마찬가지이다. 이는 일반적으로 유효한 (A\leftrightarrow B)\leftrightarrow\big((A\to B)\leftrightarrow(B\to A)\big)를 반영한다.

반면에, 0과 같은 확률에 대해 고전 논리적으로 추론하면 반대 명제 형태 \big(\neg B\lor\neg(B\to A)\big)\leftrightarrow\big(\neg A\lor\neg(A\to B)\big)가 따른다.

부정된 A를 사용한 베이즈 정리는 다음과 같다.

:P(B \vert \neg A) \big(1-P(A)\big) = \big(1-P(A\vert B)\big)P(B).

극단적인 경우 P(\neg A)=0 (즉, P(A)=1)을 배제하면, P(B\vert \neg A) = P(B)\cdot\tfrac{1-P(A\vert B)}{1 - P(A)}이고 특히

:P(\neg B\vert \neg A) = 1 - P(B)\cdot\frac{1-P(A\vert B)}{1 - P(A)}이다.

P(B)=0을 배제하면, P(A\vert B) = 1\ \leftrightarrow\ P(\neg B\vert \neg A) = 1 이며, 이는 (적어도 폭발 원리의 전제들을 배제했을 때) 고전적인 대우 원리를 포착한다.

:(B \to A) \leftrightarrow (\neg A \to \neg B).

베이즈 정리는 주관적 논리에서 다음과 같이 표현되는 역 조건부 의견 도출의 특별한 경우를 나타낸다.

:(\omega^S_{A\tilde

B},\omega^S_{A\tilde

\lnot B}) = (\omega^S_{B\vert A}, \omega^S_{B\vert\lnot A}) \widetilde{\phi} a_A,

여기서 \widetilde{\phi}는 조건부 의견을 뒤집는 연산자를 나타낸다. 인수 (\omega^S_{B\vert A},\omega^S_{B\vert\lnot A})는 출처 S가 제공하는 이항 조건부 의견의 쌍을 나타내고, 인수 a_{A}A사전 확률(기저율)을 나타낸다. 파생된 역 조건부 의견 쌍은 (\omega^S_{A\tilde

B},\omega^{S}_{A\tilde

\lnot B})로 표시된다. 조건부 의견 \omega^S_{A\vert B}는 확률적 조건부 P(A \vert B)를 일반화한다. 즉, 출처 S는 확률을 할당하는 것 외에도 조건부 명제 (A\vert B)에 대한 임의의 주관적 의견을 할당할 수 있다. 이항 주관적 의견 \omega^{S}_{A}는 출처 S가 표현하는 바와 같이 인식론적 불확실성의 정도를 가지고 명제 A의 진실에 대한 믿음이다. 모든 주관적 의견은 해당 투영 확률 P(\omega^{S}_{A})을 갖는다. 베이즈 정리를 의견의 투영 확률에 적용하는 것은 준동형사상이며, 이는 베이즈 정리가 의견의 투영 확률로 표현될 수 있음을 의미한다.

:P(\omega^S_{A \tilde

B}) = \frac{P(\omega^S_{B \vert A}) a(A)}{P(\omega^S_{B\vert A}) a(A) + P(\omega^S_{B \vert \lnot A}) a(\lnot A)}.

따라서 주관적 베이즈 정리는 베이즈 정리의 일반화를 나타낸다.[24]

참조

[1] 서적 Liberty's Apostle https://www.uwp.co.u[...] University of Wales Press 2015
[2] 서적 David Hartley on Human Nature https://books.google[...] SUNY Press 1999
[3] 간행물 An Essay towards solving a Problem in the Doctrine of Chance. By the late Rev. Mr. Bayes, communicated by Mr. Price, in a letter to John Canton, A.M.F.R.S.
[4] 문서 Holland, pp. 46–7.
[5] 서적 Price: Political Writings https://books.google[...] Cambridge University Press 1991
[6] 문서 Mitchell
[7] 서적 Classical Probability in the Enlightenment https://books.google[...] Princeton Univ Press
[8] 서적 The History of Statistics: The Measurement of Uncertainty Before 1900 Harvard University Press 1986
[9] 서적 Scientific Inference https://archive.org/[...] Cambridge University Press
[10] 간행물 Who Discovered Bayes' Theorem?
[11] 서적 Stats, Data and Models Pearson
[12] 간행물 Is the Reference in Hartley (1749) to Bayesian Inference?
[13] 간행물 Richard Price, Bayes' theorem, and God
[14] 서적 The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines & Emerged Triumphant from Two Centuries of Controversy https://archive.org/[...] Yale University Press
[15] 문서 Kendall's Advanced Theory of Statistics: Volume I – Distribution Theory Edward Arnold (publisher)|Edward Arnold
[16] 서적 Foundations of the Theory of Probability Chelsea Publishing Company
[17] 서적 Probability based on Radon measures http://archive.org/d[...] Wiley 1980
[18] 간행물 Improper priors and improper posteriors 2021-07-24
[19] 서적 Monte Carlo Statistical Methods http://worldcat.org/[...] Springer
[20] 서적 Bayesian Statistics Wiley
[21] 웹사이트 Bayes' Theorem: Introduction http://www.trinity.e[...] 2014-08-05
[22] 웹사이트 Bayes Theorem - Formula, Statement, Proof {{!}} Bayes Rule https://www.cuemath.[...] 2023-10-20
[23] 문서 Audun Jøsang, 2016, Subjective Logic; A formalism for Reasoning Under Uncertainty. Springer, Cham, {{ISBN|978-3-319-42337-1}}
[24] 문서 Audun Jøsang, 2016, Generalising Bayes' Theorem in Subjective Logic. IEEE International Conference on Multisensor Fusion and Integration for Intelligent Systems (MFI 2016), Baden-Baden, September 2016
[25] 서적 Probabilistic Graphical Models http://pgm.stanford.[...] MIT Press
[26] 간행물 The evolving landscape of expanded carrier screening: challenges and opportunities 2018-09-24
[27] 간행물 Bayesian analysis for cystic fibrosis risks in prenatal and carrier screening 2004-10
[28] 문서 Types of CFTR Mutations
[29] 문서 CFTR Gene – Genetics Home Reference
[30] 서적 Liberty's Apostle https://www.uwp.co.u[...] University of Wales Press 2015
[31] 문서 Bayes' Theorem https://plato.stanfo[...] Metaphysics Research Lab, Stanford University 2003
[32] 문서 Kendall's Advanced Theory of Statistics: Volume I—Distribution Theory Edward Arnold (publisher)|Edward Arnold
[33] 서적 수리통계학 입문 1995-03-10
[34] 서적 통계수학 세종출판사 2003-10-10
[35] 저널 An Essay towards solving a Problem in the Doctrine of Chances. By the late Rev. Mr. Bayes, F. R. S. communicated by Mr. Price, in a letter to John Canton, A. M. F. R. S. http://www.stat.ucla[...] 2014-04-23
[36] 논문 Mémoire sur la probabilité des causes par les événements http://gallica.bnf.f[...] 1774
[37] 논문 Mémoire sur les approximations des formules qui sont fonctions de très grands nombres http://gallica.bnf.f[...] 1785



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com